iT邦幫忙

2023 iThome 鐵人賽

DAY 9
0
自我挑戰組

深度學習的學習 & ASR 中文語音辨識系列 第 9

【Day 09】深度學習的學習:Bias & Variance

  • 分享至 

  • xImage
  •  

Bias & Variance

Bias(偏差值) 和 Variance(方差值) 這兩個數值是來評估你模型的分類狀況

  • Bias
    • 偏差值或是誤差值,看的是分類的正確與否
    • 偏差值低 → 命中率高;偏差值高 → 命中率低
    • e.g. 10 張圖片,其中 5 張貓貓、5 張不是貓貓,最後模型成功分類出正確的 5 張貓貓圖片,那他的 Bias 就很低
  • Variance
    • 方差值或是變異數,看的是分類的分布狀況
    • 方差值低 → 預測資料密集;方差值高 → 預測資料稀疏
    • 看圖比較好解釋

想當然耳,我們會想要者兩個值越低越好
用一張圖來看看
https://ithelp.ithome.com.tw/upload/images/20230924/20163287KCt7gVrBWV.jpg

  • 左圖 High Bias,能看到在圈圈的那一次仍然有很多叉叉在裡面,即分類的狀況沒有很好
    • 稱作 underfitting
  • 中圖,就很棒 :),該分的都有分出來,當然還是有一點點資料的沒有分出來,但整體而言已經夠好了
  • 右圖 High variance,雖然他成功地將所有資料分成兩類,零失誤,Bias 超低,但很明顯看到模型為了完美的分類資料,很故意的去抓距離較遠的資料
    • 稱作 overfitting

這邊稍稍解釋一下這兩個東西

  • underfitting
    • 擬合不足
    • 模型預測的結果無法將資料有效的分類
  • overfitting
    • 過度擬合
    • 模型預測的結果過於匹配特定的資料
    • e.g. 如果有位同學寫一張考卷可以拿100分,但答案都是用背的,真正在大考時,出現新的題目他就不會寫了

所以說,單看其中一個值你沒辦法準確地辨別模型的優劣,而在評估如何取捨這兩個值的過程即是 Bias-Variance Tradeoff
通常大家會放那張 x-y 圖,有三條線的,但我比較想提的是這張:
https://ithelp.ithome.com.tw/upload/images/20230924/20163287gbM82p0N07.png
左上角的方格開始

  1. 判斷 Bias 的大小如何
    • Bias 高
      • 可能目前的 NN 太小,或這些資料比較複雜,目前的條件就無法預測出好的結果
        → 把 NN 層數增加、擴大 NN 的大小
    • Bias 低
      • 到 Step-2!
  2. 判斷 Variance 的大小如何
    • Variance 高
      • 可能目前的 資料數量 太小,或發生 overfitting
        透過 Regularization 解決
    • Variance 低
      • 到 Step-3!
  3. 完成!

以上是簡易的判斷流程,Regularization 將在下一篇講解

Ref.


上一篇
【Day 08】深度學習的學習:Train / Dev / Test sets
下一篇
【Day 10】深度學習的學習:Regularization
系列文
深度學習的學習 & ASR 中文語音辨識30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言